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> Verfahren zur Spracherkennung durch einen Rechner 

Das Verfahren ermoglieht eine beschleunigte Kiassrfika- 
tion innerhalb eines Spracherkennungssystems. Dazu wird 
phonetisches Wissen in Form von Diatanzen zu Lsuteinhsi- 
ten benutzt, um iterativ die Gut© der Kiassrfikation zu 
verbessem. Fur einen vorgebbaren Kontextgrad wird eine 
minimale Distanz von Merkmalsvektor zu vorhandenen Laut- 
einherten berechnet und in einem nachsten Schritt innerhalb 
eines vorgebbaren Bereichs um das gefundene Minimum 
Abstande berechnet zu Leuteinherten mit hoherem Kontext- 
grad. SchlieSlich werden die kJassrfizierten Lauteinherten zu 
Sprache zusammengesetzt. 
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Beschreibung 

Die Erfindung betrifft ein Verfahren zur Spracherkennung durcfa einen Rechner. 

Spracherkennung beginnt bei der Erf assung eines Sprachsignals in Form einer Abtastung und Digital isierung. 
5 Es folgt eine M erkmalsextraktion (V orverarbeitung) und eine Klassifikation (aucfa: Distanzberechnung) des 
vorverarbeiteten Sprachsignals. Im letzten Schritt der Spracherkennung (Suche) werden Wortmodelle zugeord- 
net, es ergibt sich eine erkannte Wortsequenz (siehe [1]). 

Die Distanzberechnung stellt den rechenintensivsten Schritt bei der Spracherkennung dar. Je nach Anwen- 
dungsfaO kann dabei der Antefl der benotigten Rechenleistung fur die Distanzberechnung bis zu fiber 80% des 
io gesamten Berechnungsaufwands des Spracherkenners betragen. 

In [2] ist ein Verfahren zur Distanzberechnung genannt, das gegenuber der Erfindung den Nachteil aufweist, 
daB statistische Ouster entsprechend statistischer Verteilungen angeordnet sind, somh die Gute der Spracher- 
kennung direkt von der Anzahl der Cluster abhangt und der Berechnungsaufwand hoch ist 
A us [3] sind Hidden-Markov-ModeDe (HM Ms) zur Laut- und Wortmodellierung bekannt Weiterhin sind in [4] 
is kontinuierfiche mehrdimensionale, meist multivariate, Verteilungen (z. B. Laplace- oder GauB- Verteilungen) fur 
die Moddlierung der Merkmale implementiert 

Die Aufgabe der Erfindung besteht darin, ein Verfahren zur Distanzberechnung anzugeben, das eine schneDe 
Klassifikation eines Merkmalsvektors (mit vorgebbarer Genauigkeh) ermdglicht 
Diese Aufgabe wird gemafi den Merkmalen des Patentanspruchs 1 gelost 
20 Zu diskreten Abtastzeitpunkten wird ein Sprachsignal mh einer vorgebbaren Taktrate abgetastet und dighali- 
siert Zu jedem Abtastzeitpunkt wird das Sprachsignal in einen Meriunalsvektor mh vorgebbarer Dimension 
abgebfldet Zur Durchfuhrung der Distanzberechnung werden Abstande des jeweiligen Merkmalsvektors zu 
vorgebbaren Mustervektoren bestimmt 
Die Mustervektoren steilen unterscheidbare Lauteinhehen der Sprache dar. Jede Lauteinheh verfugt uber 
25 einen Kontextgrad, der angibt, wie weit der Kontext der Lauteinheh reichL 

Zunachst wird zu ersten Mustervektoren, die Lauteinhehen mh einem vorgebbaren ersten Kontextgrad 
darstellen, jeweils ein Abstand zu dem Merkmalsvektor berechnet Aus all den so berechneten ersten Abstanden 
wird ein erstes Minimum der ersten Abstande ausgewahlt 
Um eine genauere Klassifikation des Merkmalsvektors vornehmen zu kdnnen, werden in einem nachsten 
30 Schritt zweite Mustervektoren, die Lauteinheiten mit einem zweiten Kontextgrad darstellen, wobei der zweite 
Kontextgrad groBer als der erste Kontextgrad ist, innerhalb eines vorgebbaren Bereichs um die durch das erste 
Minimum klassifizierte Lauteinheh zur Berechnung von zweiten Abstanden herangezogen. Ein zwehes Mini- 
mum der zweiten Abstande klassifiziert eine Lauteinheit mit einem gegenuber der zu dem ersten Minimum 
gehorenden Lauteinheit hdherem Kontextgrad. 
35 Reicht die Gute der durchgefuhrten Klassifikation des Merkmalsvektors aus, so kann das Verfahren beendet 
werden, indem Sprache aus klassifizierten Lauteinhehen zusammengesetzt und somh erkannt wird. 

Soil eine genauere Klassifikation erf olgen, so wird nochmals der Kontextgrad der zu untersuchenden Lautein- 
hehen erhdht, und somh in einem vorgebbaren Bereich um die zuletzt das zuletzt klassifizierte Minimum 
Abstande zu dem Merkmalsvektor berechnet. Diese Iteration kann beliebig oft wiederhoh werden, um ein 
40 immer besseres Ergebnis zu erhalten. Allerdings genugt eine Klassifikation mh hohem Kontextgrad nicht mehr 
der Forderung nach einer Echtzeitbedingung, da die Erhohung des Kontextgrads den Aufwand fur die Berech- 
nung der Klassifikation typischerweise exponentiell ansteigen laBt 

Eine Weiterbildung des erfindungsgemaBen Verf ahrens besteht darin, bei Verwendung von Lauteinhehen mh 
hdherem Kontextgrad den nachsthoheren Kontextgrad auszuwahlen. 
45 Die Erfindung kann dahingehend wehergebQdet werden, dafi zu Beginn des Verf ahrens Lauteinhehen mh 
dem Kontextgrad *1 * verwendet werden. 

Weiterhin kdnnen als solche Lauteinhehen zu Beginn des erfindungsgemaBen Verf ahrens Phoneme oder 
Monophone einer Sprache verwendet werden. 
Eine andere Weiterbildung der Erfindung besteht darin, Diphone oder Triphone oder aus mehreren Phone- 
50 men zusammengesetzte Laute als Lauteinheiten zu verwenden. 

In den Figuren sind Ausfuhrungsbeispiele der Erfindung dargestellt, die im weheren naher erlautert werden. 
Eszeigen 

Fig. 1 ein Blockdiagramm, das Schritte des erfindungsgemaBen Verfahrens enthalt, 
Fig. 2 eine Skizze, die die Erfindung im zweidimensionalen Merkmalsraum veranschauIichL 
55 In Fig. 1 werden Schritte des erfindungsgemaBen Verfahrens fur die Berechnung der Distanz einer Unterein- 
heit dargestellt 

Vektoren werden nachfolgend als kleine fettgedruckte Zeichen oder mit einem Pfeil, Matrizen als grofie 
fettgedruckte Zeichen dargestellt 

Gesprochene Sprache wird abgetastet und in digitalisierter Form einem Rechner zuganglich gemacht In 
6o Schritt la, der Vorverarbeitung, wird demzufolge in regelmaBigen Abstand (z. B. alle 10ms) ein Merkmalsvektor 
x, der das aktuelle Sprachsignal reprasentiert, der Dimension Dz (typische Werte fur die Dimension: 20—64) 
ermittelt 

Worter werden aus Einhehen modelliert die eine Abfolge von Zustanden in einem Hidden-Markov-ModeD 
(siehe ausfuhrliche Beschreibung in [3]) darstellen. Solche Einhehen sind zumeist Phoneme, es kdnnen aber audi 
65 Halbsilben, Silben oder andere Einheiten verwendet werden. Eine Gesamtanzahl von Untereinheiten No, die die 
kJeinsten sich unterscheidenden Einheiten von Sprache darsteUeo, schwankt je nach System und gewunschter 
Applikation (z. B. Einzehvorterkennung, kontinuieriiche Sprache, Sprecherunabhangigkeh) zwischen weniger 
als 100 und mehreren 1000 Untereinheiten Nq. 
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Bei der Distanzberechnung (siehe Fig. 1, Schritte lb bis If) geht es darum, fur alle Untereinheiten N„ 
akustische Distanzen geraaB einer verwendeten modellierenden Verteilung zu berechnen. Fur jede Untereinheit 
u werden N*(u) Verteilungen zur Modellierung benutzt, wobei sich N^u) fur jede Untereinheit u unterscbeiden 
kann. Typische Werte fur N^u) liegen zwiscben 1 und 100. Bei Verwendung von GauB- Verteilungen werden 
diese dargestellt als 



91 = G(iij. Cj) 



(1) 



wobei jij der Dx-dimensionale Mhtelpunktsvektor und C die Dx-dimensionale Kovarianzmatrix der mit j indi- 
zierten GauB- Verteilung gj bezeichnen. 

Die Gesamtverteilung fur eine Untereinheit u (Summe der GauB-VerteOungen) wird dargestellt durch go- Es 
handelt sich dabei urn die mit cj gewichtete Summe der einzelnen Verteilungen: 



to 
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9u = 



Nj(u) 

j = l 



(2) . 



20 



Es ist ublich, von diagonalen Kovarianzmatrizen der Gaufiverteflungen auszugehen. o\j bezeichnet dann die 
i-te Komponente der Varianz der Verteilung j. Die Wahrscheinlichkeit dafur, daB eine bestimmte Untereinheit u 
auf getreten ist wenn der beobachtete Merkmalsvektor x voriiegt, berechnet sich zu: 2S 



N v (u) 

PuC>0 = * x 2 d^. 

j=1 n^,i 

i=l 



x exp 



(3), 



30 



wobei k eine vorgebbare implementierungsabhangige Konstante ist. 35 

Eine verwendete Naherung geht davon aus, daB die Wahrscheinlichkeit einer Untereinheit u von der Wahr- 
scheinlichkeit der "besten" (*= wahrscheinlichsten) Verteilung dominiert wird Dies bedeutet, daB in- Gleichung 
(3) die auBere Summe durch einen max-Operator ersetzt werden kann. Es ist aber immer noch die Berechnung 
der Wahrscheinlichkeit en ailer Verteilungen notwendig, denn erst dann kann der max-Operator ausgewertet 
werden: 40 



k x 



8* 

n<*j,i 



x exp 



_i ^ (*i - »j±Y 



i=l 



a 2 - 

DA 



V(j e {l,...,N v (u)}) 



(4) . 



Um die Berechnung des komplexen Terms in Gleichung (4) zu umgehen, wird Gleichung (4) logarithmiert, man 
spricht dann von Distanzen anstelle von Wahrscheinlichkeiten und bezeichnet diese Distanzen mit dj(x). Nach 
Umformen ergibt sich folgende Gleichung zur Berechnung der Distanz der akustischen Untereinheit u bei 
Vorliegen des betrachteten Merkmalsvektors x: 



45 



50 



55 



60 
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d u(*) = minj« j + K 2 ,j x 




(5) , 



V(j e {i....,*^)}) 



wobei Kij und Kzj von der Realisierung abhangige vorgebbare Konstanten darstellen, die einmal im Voraus 
berechnet werden konnen. 

Ahnliche Berechnungsschemata ergeben sich auch bei Verwendung anderer Verteflungen, z. R. der Laplace- 
Verteilung, und schranken das erfindtingsgemafie Verf ahren nicht auf die ausgefuhrte Verteflungsvariante ein. 

CHeichung (5) win! fur alle Untereinheiten u ausgewertet. Die Gesamtzahl aller Verteflungen im System fur 
alle Untereinheiten u sei N T und berechnet sich zu 



Das bedeutet, daB alle 10ms (alle 10ms wird ein Merkmalsvektor ersteDt) Nv-mal ein Dr-dimensionaler 
Abstand berechnet wird, wobei N T bei Systemen typischerweise im Bereich 1000*500 000 liegL Diese Berech- 
nung kann heutzutage von einem handelsub&chen Rechner (PC, Workstation, Signalprozessor) nicht unter 
Einhaltung der Echtzehbedingung durchgefuhrt werden. 

Das erfindungsgemaBe Verf ahren zeichnet sich dadurch aus, dafi phonetisches Wissen zur Bestimmung einer 
Untermenge von Reprasentanten herangezogen wird. Es fmdet ein direktes Clustering von Untereinheiten statL 

Die Erfmdung verwendet als ein primares Kriterium zur Ennitdung einer geeigneten Untermenge zu berech- 
nender Distanzen das Wissen urn den phonetischen Kontext der modellierten (Sprach-)Segmente bzw. Unterein- 
heiten. 

Zur Erlauterung des erfindungsgema&en Verfahrens wird von der Verwendung von Phonemen als Basis- Laut- 
einheiten fur die Spracherkennung ausgegangen. Das Verf ahren ist jedoch auf fur andere Lauteinheiten als 
Phoneme realisierbar. 

Ein typisches Spracherkennungssystem enthalt ca.40— 60 Basis-Lauteinhehen. Bei solchen Basis-Lauteinhei- 
ten handelt es sich urn kontextunabhangige Lauteinheiten. Um Sprache genauer klass ifi z i eren zu konnen, 
werden Basis-Lauteinhehen in Abhangigkeit der vorangehenden und nachfolgenden Basis-Lauteinheiten gebfl- 
deL 

Heutzutage werden Diphone, d. h. zwei Phoneme bestimmen die Untereinheit (ein Nachbarphonem wird zur 
Kontextbildung herangezogen^ Triphone, d h. drei Phoneme bestimmen die Untereinheit und Quinphone, d. h. 
funf Phoneme bestimmen die Untereinheit, verwendet 

Kontext- abhangige Lauteinheiten werden wte folgt notiert: 

Ui-L ...,i-l|,i+l,...i+r) (7) 

wobei i einen Zentrallaut markiert, bei dem 1 Laute im vorangehenden (=linken) Kontext und r Laote im 
nachfolgenden («recfaten) Kontext zur Bestimmung der Untereinheit berucksichtigt werden. Es liegt demnach 
ein (1 + r + 1)-Laut vor. 

Durch diese hier beschriebene Modellierung kann sich die Anzahl der Lauteinheiten mit hdherem Kontext- 
grad, in Abhangigkeit der jeweiligen Anwendung auf mehrere 1000 erhohen, da die Anzahl der verschiedenen 
theoretisch mdglichen Lauteinheiten mit der Potenz der berucksichtigten Kontextlange wachst 

Neben den kontext-abhangigen Lauteinheiten werden zusatzlich kontext-unabhangige Lauteinheiten (=» 
Basis-Lauteinheiten) implementiert Diese Basis-Lauteinheiten dienen bei "fastlook-ahead"-Methoden zur 
schnellen Vorauswahl von Hypothesen in der Suche nach einer Klassifikation eines Merkmalsvektors oder 
werden zur Modellierung von Wortern herangezogen, wenn wahrend einer Trainingsphase des Spracherken- 
nungssystems zu wenige Ergebnisse vorlagen, um modeUierende Verteflungen nach Cleichung (2) fur die 
detaillierten Untereinheiten (im weiteren Kontext) zu bestimmen. 

Fur alle Lauteinheiten (Untereinheiten u) wird ein Kontextgrad Gjc bestimmt, der angibt, wie wek der 
Kontext der jeweiligen Lauteinheit reicht Fur Basis-Lauteinheiten (kontextunabhangige Untereinheiten) gilt 
Gk= 1, fur Diphone gilt Gk=2, fur Triphone gflt Gk=3, usw. Fur kontextabhangige Lauteinheiten gflt gemaB 
Gleichung (7) fur den Kontextgrad 

Gie«l+r+l (8X 

In der Erfindung wird zur Entscheidung, ob die Distanz einer Lauteinheit genauer (in einem hoheren Detaillie- 
rungsgrad) berechnet werden soil, die Distanz der gleichen Lauteinheit im kleineren Kontextgrad (« abstrakte- 
ren Kontext) herangezogen. Das bedeutet, daB zur Entscheidung, ob die Distanz fur die Lauteinheit 




(6) . 



k=l 
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14}— l|,i+l,...i+r) 

explizit berechnet wird, die Distanz fur einen abstrakteren Laut 

herangezogen wird, wobei gilt fe<l r 2 <r. Der Vorteil liegt darin, daB fur alle U( . . . ), bei denen 1 2 <1, r 2 <r gilt, 
die Distanz der gleichen abstrakten Untereinheh Labs zur Entscheidung verwendet werden kann. Demzufolge 
wird bei der Wahl der abstrakten Lauteinheh bis auf die Basis-Lauteinhehen zuruckgegriffen, fur die gih l=r=0. 

Sodann wird die optimale Distanz dopt aus alien Distanzen der abstrakten Lauteinhehen berechnet (siehe 
Fig. 1, Schritt lc): 



wobei Nu^abs eine Anzahl der abstrakten Lauteinhehen bezeichnet und Nabs die Anzahl der Verteilungen, die die 
Ntubs abstrakten Lauteinheiten modelliert, bezeichnet. 

Im Schritt le werden fur Lauteinheiten nut hdherem Kontextgrad die Distanzen explizit berechnet, wobei die 
Bedingung 

duabs < dopt + thr (10) 

vorschreibt, daB innerhalb eines vorgebbaren Bereichs (gekennzeichnet durch den vorgebbaren Wert thr) urn 
das nach Gleichung (9) errechnet Minimum dopt abstrakte Lauteinheiten da^bs zu einer detaillierteren KJassifi- 
zienmg des Merkmalsvektors herangezogen werden (Schritt Id). 

Fur den vorgebbaren Wert thr kann gelten: thr = const, <Lh.es wird eine Konstante durch Vorberechnung 
bestimmt, oder der Wert thr wird implizit abhangig von dem augenblicklichen Merkmalsvektor x ausgewahlt 
gemaB 

thr = Kthrxdopt (11X 

wobei Kthr ein vorgebbarer Wert ist 

Fur alle Lauteinheiten, deren Distanz der abstrakten Lauteinheh nach Gleichung (11) nicht innerhalb des 
durch den Wert thr vorgebbaren Bereichs liegt, <L h. deren Distanz zu groB ist, wird gesetzt: 



Somh wird die Distanz der abstrakten Untereinheh gewahlt, wodurch die explizrte Berechnung der Distanz 
eingespart wird 

Die Anzahl der explizit zu berechnenden Verteilungen wird mit N t bezeichnet, wobei N t <Nv gih. Werden 
nun abstrakte Lauteinhehen zur Entscheidungsfindung nach Gleichung (10) ausgewahlt, die gleichzehig Tefl des 
Spracherkennungssystems sind, wie bspw. die Basis-Lauteinhehen, sind die Verteilungen der abstrakten Lautein- 
heiten Nabs eine Teiknenge der modeQierenden Verteilungen 



Somhgflt: 

Nges = Nabs + N t < Nv (14). 

Auf diese Weise ist inuner sichergestelk, daB nie roehr Verteilungen berechnet werden mussen, als das 
eigentliche System beinhaltet, da die zur Entscheidung herangezogenen Lauteinheiten bzw. Verteilungen Tefl 
des Systems sind. 

GemaB obiger Beschreibung wird also innerhalb des durch den Wert thr vorgegebenen Bereichs wiederum 
ein Minimum der Abstande dopt ermittelt (Schritt If) und, wenn die Gute der Klassifikation ausreicht (Schritt ldX 
das Verfahren beendet, indem Lauteinheiten zusammengesetzt werden (Schritt lg) und somh Sprache erkannt 
wird. Ist hingegen die Gute der Klassifikation noch nicht ausreichend, so wird zu Schritt le gesprungen und das 
Verfahren iteriert 

In Fig. 2 wird beispielhaft die Klassifikation im zweidimensionalen Merkmalsraum (xl, x2) veranschaulidit. In 
Fig. 2a sind ein Merkmalsvektor MV, und drei Lauteinheiten LEI, LE2 und LE3 mit demselben Kontextgrad 
dargesteUL Zu jeder Lauteinheh LEI, LE2 und LE3 wird jeweils eine Distanz dl, 62 und d3 berechnet. Das 
Minimum aus den Distanzen, hier der Abstand dl, wird gemaB Gleichung (9) ausgewahlt 

In Fig. 2b wird urn das ausgewahlte Minimum ein vorgebbarer Bereich gemaB Gleichung (10) gekennzeichnet 
durch dl + thr, bestimmt. Im Beispiel liegen auBer der Lauteinheh LEI noch weitere Lauteinheiten LEI -1, LEI -2, 
LEI -3 und LEI -4 mit gegenuber Lauteinheh LEI hdherem Kontextgrad innerhalb dieses vorgebbaren Bereichs. 




(9) . 



d(Lsp-i i-l|,i+l,...i+r))-d(Ute) (12> 



Nab s S N V 



(13) . 
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Fur jede dieser Lauteinheiten LE1-1, LE1-2, LEI -3 und LE1-4 wird jeweils die Distanz berechnet. Aus den 
resultierenden Distanzen dl-1, dl-2, dl-3 und dl-4 wird das Minimum berechnet (wieder nach Gleichung (9)). 
Das Verfahren kann fortgesetzt iteriert werden, indem um das ausgewahlte Minimum dl -4 wieder ein vorgebba- 
rer Bereich bestimmt wird und innerbalb dieses Bereichs Distanzen zu Lauteinheiten mit hdherem Kontextgrad 
als die Lauteinheit LE1-4 berechnet werden. 
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Patentanspriiche 

1. Verfahren zur Spracherkennung durch einen Rechner, 

a) bei dem ein Sprachsignal mit einer vorgebbaren Taktrate digitalisiert wird, 

b) bei dem das dighalisierte Sprachsignal zu je einem Abtastzeitpunkt, der durch die Taktrate festge- 
legt ist, in einen Merkmalsvektor abgebildet wird, 

c) bei dem erste Abstande des M erkmalsvektors zu ersten Mustervektoren ermitteh werden, wobei die 
Mustervektoren jeweils eine kleinste unterscheidbare Lauteinheit mh einem vorgebbaren Kontext- 
grad, der angibt, wie weit der Kontext einer Lauteinheit reicht, darstellen, 

d) bei dem ein erstes Minimum der ersten Abstande ausgewahlt wird, 

e) bei dem um das erste Minimum ein vorgebbarer Bereich ausgewahlt wird und in diesem Bereich 
zweite Abstande des Merkmalsvektors von zweiten Mustervektoren, die jeweils Lauteinheiten mit 
gegenuber den kleinsten unterscheidbaren Lauteinheiten hoherem Kontextgrad darstellen, bestimmt 
werden, 

f) bei dem ein zweites Minimum der zweiten Abstande ausgewahlt wird, 

g) bei dem der Merkmalsvektor durch die uber das zweite Minimum erreichbare Lauteinheit klassifl- 
ziert wird oder, falls eine genauere Kiassifikation erforderiich ist, das zweite Minimum als das erste 
Minimum angenommen und mit Scfaritt e) f ortgefahren wird, 

h) bei dem aus zusammengesetzten klassifizierten Lauteinheiten Sprache erkannt wird. 

2. Verfahren nach Anspruch 1, bei dem im Schritt e) fur die zweiten Mustervektoren der nachsthohere 
Kontextgrad gegenuber den ersten Mustervektoren ausgewahlt wird 

3. Verfahren nach Anspruch 1 oder 2, bei dem die ersten Mustervektoren kontextunabhangige Einheiten mh 
dem Kontextgrad 1 darstellen. 

4. Verfahren nach einem der Anspruche 1 bis 3, bei dem als Mustervektoren Phoneme einer Sprache 
verwendet werden. 

5. Verfahren nach einem der Anspruche 1 bis 3, bei dem als Mustervektoren Triphone einer Sprache 
verwendet werden. 

6. Verfahren nach einem der Anspruche 1 bis 3, bei dem als Mustervektoren Quinphone einer Sprache 
verwendet werden. 



Hierzu 2 Sehe(n) Zeichnungen 



ZEICHNUNGEN SEITE 2 



Nummer: 
Int. CI. 6 : 

Veroff entlichungstag : 



DE 197 19 381 CI 
G10L 5/06 

22. Januar 1998 



FIG 2a 



FIG 2b 





702 164/352 



ZEICHNUNGEN SEITE 1 Nummer: ~ DE 197 19 381' CI 

Int. CI. 6 : G 10 L 5/06 

Veroffentlichungstag: 22. Januar 1998 



FIG1 



Vorverarbeitung 



If 



I 



1a 



niedrigsten 
Kontextgrad 
auswahlen 



r 



I 



1b 



Distanzberechnung 



besten Abstand 
auswahlen (Minimum) 



r 



1c 



1f 



Minimum auswahlen 



I 




Kontexgrad erhohen; 
Distanzberechnung 

S 



Zusammensetzen der 
Lauteihheiten 
(Suche) 



r 



ig 



702 164/352 



This Page is Inserted by IFW Indexing and Scanning 
Operations and is not part of the Official Record 

BEST AVAILABLE IMAGES 

Defective images within this document are accurate representations of the original 
documents submitted by the applicant. 

Defects in the images include but are not limited to the items checked: 

□ BLACK BORDERS 

□ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 

□ FADED TEXT OR DRAWING 

^9 BLURRED OR ILLEGIBLE TEXT OR DRAWING 

□ SKEWED/SLANTED IMAGES 

□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 

□ GRAY SCALE DOCUMENTS 

□ LINES OR MARKS ON ORIGINAL DOCUMENT 

□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



